Mistral发布了全世界最好的OCR,希望不是吹牛
Mistral发布了全世界最好的OCR,希望不是吹牛今天,他们自称发布了世界上最好的 OCR API,它能够将复杂的 PDF 文件转换为文本文件,以便 AI 模型处理。现在,所有大模型的输入端格式都是文本,或者规整的、容易识别的文本文件,但这个世界上,还有很多文件是粗糙的,不规整的,难以识别的,它需要依赖强大的 OCR 功能才能转换为文本。
今天,他们自称发布了世界上最好的 OCR API,它能够将复杂的 PDF 文件转换为文本文件,以便 AI 模型处理。现在,所有大模型的输入端格式都是文本,或者规整的、容易识别的文本文件,但这个世界上,还有很多文件是粗糙的,不规整的,难以识别的,它需要依赖强大的 OCR 功能才能转换为文本。
AI Agent是一个应该非常个人化的东西。
M3 Ultra终极引擎,可跑千亿模型
故事从去年10月26日说起,在那天,黄叔非常喜欢的Arc浏览器被创始人Josh Miller决定战略性放弃,开始开发新的AI Agent浏览器Dia: 同一天,HideCloud和Peak刚从武汉飞回北京,落地后,HideCloud震惊的发现,打开手机刷的第一条推特就是上面这条,因为,此前的两天,他们在武汉决定了终止AI浏览器的研发工作,莫名其妙的中美两只团队在同一刻达成了共识。
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络(Multi-head Latent Attention, MLA)是其经济推理架构的核心之一,通过对键值缓存进行低秩压缩,显著降低推理成本 [1]。
Manus刷屏一天,从开始的一夜成名,到中间的一码难求,再到质疑它的宣发一掷千金,整个过程里,FOMO情绪和直觉警惕交缠不休,是很有意思的传播学样本。
昨夜,AI Agent 产品 Manus 横空出世,瞬间点燃科技圈。此刻,所有 AI 爱好者都在疯抢 Manus 邀请码,甚至在某二手交易平台上,邀请码的价格已经被炒到 999 元到 5 万元不等。
AI Coding 是我们长期关注的领域,在这个领域中我们已经介绍过 bolt.new、Cursor 等公司,Lovable 是最新快速崛起的一家公司。Lovable 产品自发布以来就展示了惊人的增长速度,ARR 几乎每周增长 100 万美元,3 个月 ARR 就从 0 增长至 1700 万美元,付费用户数高达 3 万多人,成为欧洲历史上增速最快的初创企业。
Manus 来了。它让我想起两个概念:「抽象之梯」和「抽象泄漏」。我感觉的趋势:AI 的抽象封装越来越完善,抽象泄漏问题被更好地解决,留给与人交互的界面,变得极为简单直接。这时候,人在这个界面中,交互什么呢?交互自己当前在「抽象之梯」的所在位置(理解深度)。
在周二巴塞罗那的移动世界大会炉边谈话中,Bret Taylor 仍未给出 AI Agent的确切定义。